資料分析(Data Analysis)大概是人類「理性思考」的一種表現,無論在任何領域的專業裡,這都是一項核心的技術:從經驗裡去焠鍊原則,並且對未來遭遇的狀況做出預測、因應或建議,只是每個領域的「經驗」性質都不一樣,「焠鍊」的方法也就不同。
拜過去半個世紀的資訊革命及數位化之賜,人們各式各樣的「經驗」逐漸累積成大規模的「數位資料」,而這些資料的分析,理論上應該可以用一些共通的方法,去尋找當中的模式(pattern),而這個「在大量資料中尋找知識」的計算方法,便形成了「知識探勘」(knowledge discovery)這個領域。這個專業領域的方法源自於「資料探勘」(Data Mining),但是更聚焦於所探勘的資料的類型,以及探勘結果的呈現方式。
當然,刻意去區分領域的不同,對現實問題來說不是那麼重要,這整套關於資料的收集、整理、分析、結果呈現等等的相關專業,目前正統合成一個稱為 Data Science 或 Data Analytics 的領域,有興趣的話,KDnuggets 跟 Strata Conference 是個不錯的起點。
在技術上,這個領域需要統計學以及資訊科學的訓練;在實務應用上,也非常需要溝通能力的培養,以理解所要探勘的資料內容,以及想要尋找的目標是什麼;另外當然也需要審美的能力與創意,方能以最容易讓人理解的方式呈現所尋找到的知識,進而協助決策,或是引發其他的創意。
之後會陸續有一系列介紹的文章,這算是開場白。
沒有留言:
張貼留言